#bajo rango

FlexRank: Descomposición Anidada de Bajo Rango para Despliegue Adaptativo

FlexRank extrae submodelos de capacidad variable de modelos sin reentrenar. Optimiza costos y rendimiento para despliegue adaptativo a todo presupuesto.

2026-06-03 · 1 min

OP-LoRA: La bendición de la dimensionalidad

OP-LoRA mejora el rendimiento de LoRA al añadir MLP temporal que se descarta. Logra hasta 15 puntos más en generación de imágenes.

2026-06-02 · 2 min

RefLoRA: Adaptación de Bajo Rango Refactorizada para Modelos Grandes

Descubre RefLoRA, una nueva técnica de fine-tuning que acelera la convergencia y mejora el rendimiento de modelos grandes con mínimo costo computacional.

2026-06-02 · 2 min

LRAgent: Caché KV Compartido Eficiente para Agentes Multi-LoRA

Descubre cómo LRAgent comparte eficientemente la caché KV entre agentes Multi-LoRA, reduciendo memoria y cómputo sin perder precisión. ¡Optimiza tus LLMs!

2026-06-02 · 3 min

GPTQ-intrinsic LoRA: Cuantización de baja precisión con adaptación de bajo rango

GPTQ-intrinsic LoRA: mejora la cuantización de baja precisión con corrección de bajo rango. Algoritmo casi óptimo para modelos grandes.

2026-06-02 · 2 min

GPTQ-intrinsic LoRA: algoritmo cuasióptimo para cuantización y adaptación de bajo rango

GPTQ-intrinsic LoRA combina cuantización de baja precisión y adaptación de bajo rango para comprimir redes neuronales. Algoritmo sin entrenamiento mejora modelos como Qwen3 y DeiT.

2026-06-02 · 2 min

ProjQ: Compresión de LLM con Cuantización y Adaptadores

ProjQ revoluciona la compresión de LLMs al proyectar el ruido de cuantización en un subespacio de bajo rango. Obtén modelos más ligeros y eficientes con fine-tuning mejorado.

2026-06-02 · 2 min

ADNTN: Redes Tensoriales Diferenciables para Compresión Exponencial de DNN

Explora ADNTN: comprime DNN hasta 77,000x, mejorando precisión. Redes tensoriales no lineales automáticamente diferenciables.

2026-06-02 · 2 min

Adaptadores CP: pasos de parámetros más finos en PEFT

Los adaptadores CP ofrecen pasos de parámetros 21 veces más finos que LoRA. ¿Mejoran la precisión? Estudio controlado en OPT-1.3B revela resultados según la tarea.

2026-06-02 · 3 min

Optimización bayesiana causal con transferencia entre intervenciones

Descubre cómo la optimización bayesiana causal transfiere información entre intervenciones, reduciendo costos y mejorando estimaciones en sistemas.

2026-06-02 · 2 min

Reexaminando la adaptación de bajo rango para ajuste fino privado de LLMs

Descubre cómo restaurar el rápido decaimiento de valores singulares mejora la eficiencia del ajuste fino privado de LLMs con DP-SGD, sin comprometer privacidad.

2026-06-01 · 2 min

Entrenamiento sin gradientes de SNN con estrategias evolutivas de bajo rango

Descubre cómo el método EGGROLL entrena redes neuronales de picos sin gradientes, logrando un 79.21% de precisión y 2.23x más rápido en hardware neuromórfico.

2026-06-01 · 3 min

CSULoRA: Actualización Segura de Bajo Rango para Modelos de Lenguaje

CSULoRA corrige adaptadores LoRA para evitar que el fine-tuning adversarial dañe la seguridad de los LLMs, preservando la utilidad del modelo. Descubre cómo.

2026-06-01 · 2 min